in
AI उत्पाद रैंकिंग
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
होम
AI समाचार
AI दैनिक
मुद्रीकरण गाइड
AI ट्यूटोरियल
AI उपकरण नेविगेशन
AI उत्पाद लाइब्रेरी
in
AI उत्पाद रैंकिंग
वैश्विक AI उत्पाद गतिशीलता खोजें
वैश्विक AI जानकारी खोजें, AI में नए अवसर खोजें
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
प्रकार :
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
2024-07-18 13:54:07
.
AIbase
.
10.3k
माइक्रोसॉफ्ट Q-Sparse मॉडल: 8B पैरामीटर प्रदर्शन 7B मॉडल के करीब, प्रशिक्षण और फाइन-ट्यूनिंग में आसानी!
बड़े भाषा मॉडल (LLMs) अपनी उत्कृष्ट प्राकृतिक भाषा प्रसंस्करण क्षमताओं के लिए प्रसिद्ध हैं, लेकिन व्यवहार में, उनके अनुकरण चरण उच्च गणना लागत और मेमोरी उपयोग की चुनौतियों का सामना करते हैं। LLMs की दक्षता बढ़ाने के लिए, शोधकर्ताओं ने एक तकनीक पेश की है जिसे Q-Sparse कहा जाता है। Q-Sparse विधि सक्रियता में top-K अस्पष्टता और सीधा अनुमान लगाने वाले तकनीकों को लागू करके पूरी तरह से अस्पष्ट सक्रियता की स्थिति संपीड़न हासिल करती है, जिससे अनुकरण दक्षता में महत्वपूर्ण वृद्धि होती है। शोध से पता चलता है कि Q-Sparse परिणामों को बनाए रखते हुए